AI资讯新闻榜单内容搜索- DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  DeepSeek
Lex Fridman 五小时播客实录:中美 AI 竞争与国运

Lex Fridman 五小时播客实录:中美 AI 竞争与国运

Lex Fridman 五小时播客实录:中美 AI 竞争与国运

在这个对谈中,Lex Fridman 与半导体分析专家 Dylan Patel(SemiAnalysis 创始人)和人工智能研究科学家 Nathan Lambert(艾伦人工智能研究所)展开对话,深入探讨 DeepSeek AI 及其开源模型 V3 和 R1,以及由此引发的 AI 发展地缘政治竞争,特别是中美在 AI 芯片和技术出口管制领域的博弈。   

来自主题: AI资讯
7417 点击    2025-02-04 18:53
进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

进击的DeepSeek,一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

春节假期未过半,DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。 今天一觉醒来, DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录,开发人员可以快速地进行实验、迭代,并将这款热门模型集成到他们的工作流程中。

来自主题: AI资讯
7398 点击    2025-02-01 18:54
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。

来自主题: AI资讯
6031 点击    2025-01-30 14:58
一场关于DeepSeek的高质量闭门会:比技术更重要的是愿景

一场关于DeepSeek的高质量闭门会:比技术更重要的是愿景

一场关于DeepSeek的高质量闭门会:比技术更重要的是愿景

2025年1月26日,拾象创始人兼CEO李广密,组织了一场关于 DeepSeek的闭门讨论会,嘉宾包括数十位顶尖AI研究员、投资人与一线 AI 从业者,围绕DeepSeek的技术细节、组织文化以及其出圈后的短中长期影响等,进行了探讨与学习。

来自主题: AI资讯
9354 点击    2025-01-28 11:00
国产 AI 最卷一夜!大模型黑马 DeepSeek、Kimi 硬刚 OpenAI o1,实测体验到底有多强

国产 AI 最卷一夜!大模型黑马 DeepSeek、Kimi 硬刚 OpenAI o1,实测体验到底有多强

国产 AI 最卷一夜!大模型黑马 DeepSeek、Kimi 硬刚 OpenAI o1,实测体验到底有多强

赶在放假前,支棱起来的国产 AI 大模型厂商井喷式发布了一大堆春节礼物。前脚 DeepSeek-R1 正式发布,号称性能对标 OpenAI o1 正式版,后脚 k1.5 新模型也正式登场,表示性能做到满血版多模态 o1 水平。

来自主题: AI资讯
6269 点击    2025-01-24 11:10
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。」DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。最先陷入恐慌的,似乎是同样推崇开源的 Meta。

来自主题: AI资讯
6947 点击    2025-01-24 10:59
DeepSeek-R1 是怎么训练的|深度拆解

DeepSeek-R1 是怎么训练的|深度拆解

DeepSeek-R1 是怎么训练的|深度拆解

昨天晚上,DeepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网: R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API,对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,小模型则超越 OpenAI o1-mini

来自主题: AI技术研报
19395 点击    2025-01-21 13:15
最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

“欧洲版 OpenAI” Mistral 的代码模型 CodeStral,又上新了! 而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐,共同位列 Copilot 竞技场第一名。

来自主题: AI资讯
7314 点击    2025-01-14 15:42
省钱也是技术活:解密DeepSeek的极致压榨术

省钱也是技术活:解密DeepSeek的极致压榨术

省钱也是技术活:解密DeepSeek的极致压榨术

没有GPU Poor,只有卷得不够多。 DeepSeek-V3的横空出世,用一组惊人的数据完美诠释了这句话。

来自主题: AI资讯
7645 点击    2025-01-02 10:19
又是来自浙大,“大模型届的拼多多”要刺破英伟达泡沫?

又是来自浙大,“大模型届的拼多多”要刺破英伟达泡沫?

又是来自浙大,“大模型届的拼多多”要刺破英伟达泡沫?

一个来自中国的开源模型,让整个AI圈再次惊呼“来自东方的神秘力量”。 昨天,国内知名大模型创业公司“深度求索”通过官方公众号宣布上线并同步开源 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。

来自主题: AI资讯
7366 点击    2024-12-29 10:50